Wpływ Social Media na życia studentów
1 Wprowadzenie
W dobie powszechnej cyfryzacji media społecznościowe stały się nieodłącznym elementem codzienności akademickiej, kształtując sposób, w jaki studenci komunikują się, spędzają wolny czas i budują relacje. Celem niniejszego raportu jest wielowymiarowa analiza wpływu korzystania z platform społecznościowych na dobrostan studentów. Szczególny nacisk położono na zbadanie korelacji między czasem ekranowym a zdrowiem psychicznym, jakością snu oraz wynikami w nauce.
Raport zawiera przegląd kluczowych statystyk, wizualizację rozkładu zmiennych oraz wnioski płynące z analizy zależności między cechami demograficznymi a wzorcami zachowań cyfrowych. Analizowany zbiór danych składa się z 705 obserwacji oraz 13 zmiennych, obejmujących m.in. dane demograficzne, preferowane platformy, czas użytkowania oraz wskaźniki subiektywnego poczucia uzależnienia.
Projekt pomoże odpowiedzieć na postawione przez nas pytania badawcze, takie jak: - Czy istnieje statystycznie istotna zależność między poziomem uzależnienia od social mediów a zdrowiem psychicznym studentów, - Jak korzystanie z mediów społecznościowych wpływa na wyniki akademickie? -
1.1 Opis danych
Analizowany zbiór danych składa się z 13 zmiennych dotyczących studentów z różnych krajów. Dane obejmują trzy kluczowe obszary:
Demografię (m.in. wiek, płeć, poziom edukacji).
Aktywność w sieci (średni czas korzystania, najczęściej używana platforma).
Wskaźniki dobrostanu (poziom uzależnienia, ocena zdrowia psychicznego, jakość snu oraz wpływ na wyniki w nauce).
Zbiór jest kompletny i nie zawiera brakujących wartości.
2 Porządkowanie danych
2.1 Braki danych
W danych znajduje się 100 % kompletnych wartości.
2.2 Walidacja danych
- czy wiek przyjmuje wartości od 16 - 25?
- czy godziny przyjmują wartości 0 - 24?
- czy wszystkie wartości liczbowe są większe od 0?
- czy mental health score i addicted score przyjmują wartości 1 - 10?
- płeć - kobieta lub mężczyzna?
- poziom wykształcenia - szkoła średnia, studia I stopnia lub studia II stopnia
- status związku - wolny, w związku, “to skomplikowane”
- czy wpływa na wyniki akademickie - tak lub nie?
reguly <- validator(
Age >= 16 & Age <= 25,
Gender %in% c("Female", "Male"),
Academic_Level %in% c("High School", "Undergraduate", "Graduate"),
Avg_Daily_Usage_Hours > 0 & Avg_Daily_Usage_Hours < 24,
Affects_Academic_Performance %in% c("Yes", "No"),
Sleep_Hours_Per_Night >= 0 & Sleep_Hours_Per_Night <= 24,
Mental_Health_Score >= 1 & Mental_Health_Score<=10,
Relationship_Status %in% c("In Relationship", "Single", "Complicated"),
Addicted_Score >= 1 & Addicted_Score <= 10
)## Warning: The 'barplot' method for confrontation objects is deprecated. Use
## 'plot' instead
3 Wizualizacja danych
3.1 Charakterystyka demograficzna badanej grupy studenckiej
3.1.1 Rozkład Płci i Poziomu Akademickiego
dane$Academic_Level <- factor(dane$Academic_Level,
levels = c("High School", "Undergraduate", "Graduate"))
dane$Gender <- factor(dane$Gender,
levels = c("Male", "Female")
)
ggplot(dane, aes(x = Academic_Level, fill=Gender)) +
geom_bar(position = "dodge") +
labs(title = "Rozkład płci i poziomu akademickiego",
x = "Poziom akademicki",
y = "Liczba studentów") +
theme_minimal()Analiza struktury demograficznej wskazuje na równomierny rozkład płci (blisko 50/50), natomiast w podziale na poziom edukacji przeważają osoby na studiach I i II stopnia, stanowiąc łącznie ponad 96% próby.
3.1.2 Wiek badanych
ggplot(dane, aes(x = Age)) +
geom_histogram(binwidth = 0.5, fill = "skyblue", color = "black") +
labs(title = "Wiek badanych studentów",
x = "Wiek",
y = "Liczba studentów") +
theme_minimal()Większość badanych to osoby w wieku od 19 do 23 lat, co wskazuje na silną koncentrację danych wokół typowego wieku studenckiego. Średnia wieku w próbie wynosi około 21 lat.
3.4 Zdrowie psychiczne
#mozaikowy, na plakacie z ggplota
ggplot(dane, aes(x = factor(Mental_Health_Score, levels = 1:10))) +
geom_bar(fill = "#9f2042", color = "#6c0d27")+
labs(
title = "Ocena zdrowia psychicznego studentów",
x = "Poziom zdrowia psychicznego",
y = "Liczba studentów"
) +
theme_minimal() +
theme(plot.title = element_text(hjust = 0.5))Rozkład ocen zdrowia psychicznego studentów wskazuje, że odpowiedzi koncentrują się w środkowym zakresie skali. Najczęściej deklarowane wartości mieszczą się pomiędzy 5 a 7 punktów, przy czym najwyższą liczebność odnotowano dla oceny 6. W badanej próbie nie odnotowano odpowiedzi dla najniższych wartości skali (1–3) ani dla wartości maksymalnej (10), co sugeruje brak skrajnie negatywnych oraz skrajnie pozytywnych ocen zdrowia psychicznego wśród respondentów. Uzyskany rozkład wskazuje na umiarkowany poziom subiektywnego dobrostanu psychicznego w analizowanej grupie studentów.
4 Statystyki opisowe
4.1 Statystyki opisowe dla zmiennej Avg_Daily_Usage_Hours w podziale na 5 najczęściej używanych platform
Ze względu na nierówną liczebność obserwacji w poszczególnych kategoriach zmiennej Most Used Platform, analizę ograniczono do pięciu najczęściej deklarowanych platform społecznościowych.
top5_platform <- dane %>%
count(Most_Used_Platform, sort = TRUE) %>%
slice_head(n = 5) %>%
pull(Most_Used_Platform)
Avg_Daily_Usage_Hours <- dane %>%
filter(Most_Used_Platform %in% top5_platform) %>%
group_by(Most_Used_Platform) %>%
summarise(
N = n(),
Min = min(Avg_Daily_Usage_Hours),
Q1 = quantile(Avg_Daily_Usage_Hours, 0.25),
Mediana = median(Avg_Daily_Usage_Hours),
Średnia = mean(Avg_Daily_Usage_Hours),
Q3 = quantile(Avg_Daily_Usage_Hours, 0.75),
Max = max(Avg_Daily_Usage_Hours),
SD = sd(Avg_Daily_Usage_Hours),
IQR = IQR(Avg_Daily_Usage_Hours)
)
kable(
Avg_Daily_Usage_Hours,
digits = 2,
caption = "Statystyki opisowe Avg_Daily_Usage_Hours dla 5 najczęściej używanych platform"
) %>%
kable_paper(full_width = FALSE)| Most_Used_Platform | N | Min | Q1 | Mediana | Średnia | Q3 | Max | SD | IQR |
|---|---|---|---|---|---|---|---|---|---|
| 123 | 2.3 | 3.7 | 4.50 | 4.51 | 5.00 | 7.2 | 1.11 | 1.30 | |
| 249 | 2.2 | 4.0 | 4.70 | 4.87 | 5.70 | 8.5 | 1.24 | 1.70 | |
| TikTok | 154 | 3.3 | 4.6 | 5.30 | 5.35 | 5.97 | 8.4 | 1.05 | 1.38 |
| 30 | 2.1 | 4.4 | 4.65 | 4.87 | 5.47 | 6.3 | 0.87 | 1.07 | |
| 54 | 5.5 | 6.0 | 6.45 | 6.48 | 7.00 | 7.5 | 0.59 | 1.00 |
Osoby, które wskazały WhatsApp jako najczęściej używaną aplikację, spędzają przeciętnie najwięcej czasu ogółem w mediach społecznościowych w ciągu dnia. Wysoki łączny czas korzystania obserwuje się również wśród użytkowników TikToka, natomiast osoby deklarujące Facebook, Instagram lub Twitter jako najczęściej używaną platformę spędzają w mediach społecznościowych średnio mniej czasu. Największe zróżnicowanie dziennego czasu korzystania występuje wśród użytkowników Instagrama, a najmniejsze w grupie użytkowników WhatsAppa.
| platform | boxplot | histogram | points1 |
|---|---|---|---|
| TikTok | |||
4.2 Statystyki opisowe dla zmiennej Addicted Score w podziale na płeć
raport <- list("Addicted Score" =
list("Min"= ~ min(Addicted_Score),
"Max"= ~ max(Addicted_Score),
"Q1"= ~ quantile(Addicted_Score,0.25),
"Mediana"= ~ round(median(Addicted_Score),2),
"Q3"= ~ quantile(Addicted_Score,0.75),
"Średnia"= ~ round(mean(Addicted_Score),2),
"Odch. std."= ~ round(sd(Addicted_Score),2),
"IQR"= ~ round(IQR(Addicted_Score),2),
"Odch. ćwiartkowe"=~round(IQR(Addicted_Score)/2,2),
"Odch. std. w %"=~round((sd(Addicted_Score)/mean(Addicted_Score)),2), "Odch. ćwiartkowe w %"=~round((IQR(Addicted_Score)/median(Addicted_Score)),2), "Skośność"=~round(skew(Addicted_Score),2), "Kurtoza"=~round(kurtosi(Addicted_Score),2) ))
tabela_gender <- dane %>%
group_by(Gender) %>%
summarise(
Min = min(Addicted_Score),
Q1 = quantile(Addicted_Score, 0.25),
Mediana = median(Addicted_Score),
Q3 = quantile(Addicted_Score, 0.75),
Max = max(Addicted_Score),
Średnia = mean(Addicted_Score),
SD = sd(Addicted_Score),
Skośność = psych::skew(Addicted_Score),
Kurtoza = psych::kurtosi(Addicted_Score)
)
kable(tabela_gender,
digits = 2,
caption = "Tabela 4.3. Statystyki opisowe Addicted_Score w podziale na płeć") %>%
kable_paper("striped", full_width = FALSE)| Gender | Min | Q1 | Mediana | Q3 | Max | Średnia | SD | Skośność | Kurtoza |
|---|---|---|---|---|---|---|---|---|---|
| Male | 2 | 5 | 7 | 7 | 9 | 6.36 | 1.45 | -0.45 | -0.82 |
| Female | 3 | 5 | 7 | 8 | 9 | 6.52 | 1.71 | -0.24 | -1.05 |
Średnie i mediany wyników uzależnienia są podobne dla obu płci, przy czym kobiety mają nieco wyższą średnią i większą zmienność. Różnice między mężczyznami a kobietami są niewielkie i nie wskazują na znaczącą przewagę jednej grupy pod względem poziomu uzależnienia.
5 Wnioskowanie statystyczne
anova <- aov(Mental_Health_Score ~ Most_Used_Platform, data=dane)
dane |>
aov(Mental_Health_Score ~ Most_Used_Platform, data=_) |>
tidy() |>
kbl() |>
kable_classic(full_width = FALSE, html_font="Cambria")| term | df | sumsq | meansq | statistic | p.value |
|---|---|---|---|---|---|
| Most_Used_Platform | 11 | 229.1215 | 20.8292240 | 22.89156 | 0 |
| Residuals | 693 | 630.5665 | 0.9099083 | NA | NA |